seo - نتایج رتبه بندی
- نتایج رتبه بندی
فرض کنید مجموعه ای از صفحات که حاوی پرس و جوی کاربر هستند را در اختیار دارید ، اکنون زمان آن رسیده است که بر اساس میزان انطباق با پرس و جو ، رتبه بندی را انجام دهیم. گوگل از فاکتورهای زیادی برای رتبه بندی نتایج پرس و جو استفاده میکند. برای این منظور الگوریتم رتبه صفحه یکی از بهترین الگوریتمهاست.
رتبه صفحه 2 چیز را ارزیابی میکند :
1. به یک صفحهی وب چند لینک از صفحات دیگر وجود دارد.
2. کیفیت سایتهایی که به آنها پیوند داده شده است.
در رتبه صفحه 5 تا 6 پیوند با کیفیت از سایتهایی نظیر CNN و NyTimes بیش از 2 برابر تعداد زیادی پیوند از سایتهای کم ارزش تر ، ارزش دهی میشود. البته گوگل از بسیاری فاکتورهای دیگر در کنار رتبه صفحه استفاده میکند. مثلاً اگر سندی حاوی کلمات جنگ و سرد دقیقاً کنار یکدیگر باشد ، ممکن است مرتبط تر از سندی باشد که جنگ انقلابی را در مورد بحث قرار داده و بعضی جاها کلمه سرد را استفاده کرده است.
هم چنین اگر یک صفحه دارای کلمات جنگ سرد در عنوان خود باشد ، این خود سرنخی است که نشان میدهد محتویات این صفحه مرتبط تر از صفحه ایست که عنوان آن مد آمریکا در قرن نوزدهم میباشد. هم چنین اگر کلمات جنگ سرد چند بار در صفحه ای تکرار شوند ، این صفحه به نظر بهتر از صفحه ایست که این کلمات تنها یک بار در آن آمده اند.
به عنوان یک قانون ، گوگل سعی میکند صفحاتی را پیدا کند که هم معتبرترند و هم مرتبط تر. اگر دو صفحه پیدا شوند که در یک پرس و جو مطالبشان تقریباً به یک اندازه با موضوع جست و جو انطباق دارد ، معمولاً صفحه ای انتخاب میشود که سایتهای معتبرتر و مطمئن تری به آن پیوند دارد.
هم چنین برای یک صفحه با پیوندهای کم تر و رتبهی پایین تر ، در صورتی که نشانههای دیگری ثابت کنند که صفحه مرتبط تر است را ممکن است در سطح بالایی رتبه بندی کند. مثلاً صفحه ای که کاملا به موضوع جنگ سرد اختصاص یافته مفیدتر از مقاله ایست که جنگ سرد را سرسری بررسی کرده است. حتی اگر مقاله بخشی از یک سایت معتبر و آبرومند مثل Time.com باشد. هنگامی که لیست اسناد و امتیازهای آنها ساخته شد اسناد با بالاترین امتیاز به عنوان سندی که بیشترین انطباق را دارند انتخاب میشوند.
گوگل قدری کار اضافه هم انجام میدهد تا خلاصه – چند کلمه که خلاصه ای از سند پیدا شده را نمایش میدهد و عبارت پرس و جو در آن غلامت زده شده است – را نشان دهد. بیایید به پیوندهای رتبه بندی شده و خلاصههایی که به عنوان نتیجه به کاربر نشان داده میشوند بر گردیم.
اجرای یک موتور جست و جو مقدار زیادی از منابع محاسباتی را به کار میگیرد. برای هر پرس و جو که کاربر وارد میکند ، بیش از 500 کامپیوتر ممکن است برای پیدا کردن بهترین اسناد ، کار کنند و همه اینها در کم تر از نیم ثانیه اتفاق میافتد ]18[.
1-1- الگوریتم امتیاز صفحهی گوگل
امتیاز صفحه موضوعیست که بیشتر توسط متخصصان بهینه سازی موتورهای جست و جو مورد بحث قرار میگیرد. در قلب امتیاز صفحه فرمولهای ریاضی وجود دارد که در ظاهر ترسناک به نظر میآیند ، اما فهم آن در حقیقت ساده است.
1-1-1- GoogleToolbar گوگل
گوگل دارای ابزاریست به نام GoogleToolbar که اگر آن را نصب کنید در نوار ابزار مرورگر شما ظاهر شده و هنگام گشت زنی در وب وارد هر سایتی که بشوید رتبهی آن را (با استفاده از الگوریتم امتیاز صفحهی گوگل ) به شما نشان میدهد. این ابزار بسته به میزان رتبهی سایت ، عددی بین 1 تا 10 را نمایش میدهد.
البته حداکثر امتیاز صفحهی صفحات هر ماه که گوگل اندیس گذاری مجدد انجام میدهد ، تغییر میکند. اگر فرض کنیم که مقیاس الگوریتمی باشد ، پس گوگل میتواند به سادگی بالاترین مقیاس را در نوار ابزار همان 10 بدهد و بقیه را در شکل مناسبی مقیاس دهی کند ]8[.
1-1-2- بررسی امتیاز صفحه
در یک کلمه امتیاز صفحه یک رای است که میزان اهمیت یک صفحه را معین میکند. پیوند دادن به یک صفحه در واقع رای پشتیبانی به آن صفحه میباشد. اگر پیوندی وجود نداشته باشد ، پشتیبانی هم وجود ندارد.
بر اساس اسناد اصلی گوگل امتیاز صفحه بدین گونه تعریف میشود :
فرض میکنیم صفحهی A ، صفحات T1... Tn را دارد که به آن اشاره میکنند. پارامتر d یک فاکتور تعدیل است که عددی بین صفر و یک میباشد. معمولاً d= 0.85 در نظر میگیریم. هم چنین C(A) تعداد پیونهای خارج شده از صفحهی A میباشد. امتیاز صفحهی صفحهی A به صورت زیر حساب میشود:
PR(A) = (1-d) + d(PR(T1)/C(T1)+...+PR(Tn)/C(Tn))
ملاحظه میکنید که امتیاز صفحه یک توزیع احتمال را روی صفحات وب شکل میدهد ، بنابراین جمع امتیاز صفحهی همهی صفحات وب 1 است.
نکته : امتیاز صفحه یا PR(A) با استفاده از یک الگوریتم تکرارشوندهی ساده میتواند باشد.
PR(Ti) : امتیاز صفحهی i امین صفحه.
C(Ti) : هر صفحه رای خود را به طور مساوی بین همهی پیوندهای خروجی اش تقسیم میکند. تعداد پیونهای خروجی برای صفحه 1 ، C(T1) ، برای صفحه n ، C(Tn) است و به همین ترتیب برای بقیهی صفحات.
PR(Tn)/C(Tn) : اگر از صفحه n به صفحه A پیوندی وجود دارد ، رایی که صفحه A میگیرد برابر است با PR(Tn)/C(Tn).
d : یعنی فاکتور تعدیل. همهی این آرا با هم جمع میشوند ولی برای جلوگیری از اینکه صفحات دیگر تاثیر بیش از اندازه ای داشته باشند ، حاصل جمع برای تبدیل شدن در 0.85 ضرب میشود.
(1-d) : یعنی اگر هیچ پیوندی به یک صفحه وجود نداشته باشد (یعنی صفحه هیچ BackLink ی نداشته باشد ) در آن صورت باز هم یک امتیاز صفحه کوچک به اندازه 0.15 میگیرد. در مستندات اصلی گوگل به عنوان جمع نرمال سازی مطرح شده است ]2[.
1-1-3- امتیاز صفحه چگونه محاسبه میشود ؟
امتیاز صفحهی هر صفحه بستگی به امتیاز صفحاتی دارد که به آن صفحه اشاره میکنند. اما تازمانی که امتیاز صفحهی صفحاتی را که به یک صفحه اشاره میکنند را ندانیم ، نمیتوانیم امتیاز صفحهی آن صفحه را به دست آوریم و هنگامی که میبینید پیوندهای آن صفحه حالت حلقه ایجاد میکنند ، انجام این محاسبات غیرممکن است. اما در واقع به این بدی هم نیست. این قسمت از مستندات گوگل را به خاطر بسپارید :
امتیاز صفحه یا PR(A) با استفاده از الگوریتم تکرار شوندهی ساده قابل انجام است.
آنچه برای ما معنی دارد این است که میتوانیم امتیاز صفحهی یک صفحه را بدون داشتن مقدار نهایی امتیاز صفحهی صفحات دیگر محاسبه کنیم. اما این به نظر عجیب است. اما در واقع هر بار که محاسبات را تکرار کنیم تخمینی نزدیکتر به مقدار نهایی را به دست میآوریم.
بنابراین باید هر مقداری که محاسبه کردیم را نگه داریم و محاسبات را چند بار تکرار کنیم تا زمانیکه اعداد زیاد تغییر نکنند. بیایید ساده ترین مثال را در نظر بگیریم. 2 صفحه داریم که هر کدام به دیگری اشاره میکنند ، هر صفحه یک پیوند خروجی دارد و C(A)=1 ، C(B)=1 میباشد. ما نمیدانیم برای شروع امتیاز صفحه آنها چیست.
حدس 1 : پس بیایید یک حدس بزنیم و محاسبات را با مقدار 1 شروع کنیم :

شکل (1-1) یک سلسله مراتب ساده از ارتباط بین دو صفحه
d = 0.85
PR(A) = (1-d) + d(PR(B)/1)
PR(B) = (1-d) + d(PR(A)/1)
مثل :
PR(A) = 0.15 + 0.85 * 1 = 1
PR(B) = 0.1 5+ 0.85 * 1 = 1
میبینید که اعداد تغییر نکرده اند. به نظر میآید با یک عدد خوب شروع نکرده ایم.
حدس 2 : بیایید اکنون با صفر شروع کرده و محاسبات را 2 باره انجام دهیم.
PR(A) = 0.15 + 0.85 * 0 =0.15
حالا از مقدار PR(A) که حساب کرده ایم در همین جا استفاده میکنیم.
PR(B) = 0.15 + 0.85 * 0.15 = 0.2775
و دوباره :
PR(A) = 0.15 + 0.85 * 0.2775 = 0.385875
PR(B) = 0.15 + 0.85 * 0.385875 = 0.47799375
و دوباره :
PR(A) = 0.15 + 0.85 * 0.47799375 = 0.5562946875
PR(B) = 0.15 + 0.85 * 0. 5562946875 = 0.622850484375
و به همین صورت اعداد به بیشتر شدن ادامه میدهند.
اما آیا افزایش اعداد بعد از رسیدن به 1 متوقف میشود ؟ چه میشود اگر به وقدار بیشتر از 1 برسیم ؟
حدس 3 : بیایید با مقدار 40 شروع کرده و محاسباتی را انجام دهیم.
PR(A) = 40 , PR(B) = 40
اولین محاسبه :
PR(A) = 0.15 + 0.85 * 40 =34.15
PR(B) = 0.15 + 0.85 * 34.15 = 29.1775
و دوباره :
PR(A) = 0.15 + 0.85 * 29.1775 = 24.950875
PR(B) = 0.15 + 0.85 * 24.950875 = 21.35824375
میبینید که اعداد با هر محاسبه دارند کاهش مییابند. این اطمینان میدهد که اعداد به 1 خواهند رسید و متوقف میشوند.
اصل : مهم نیست حدس خود را از کجا شروع کنید ، هنگامی که محاسبات امتیاز صفحه پایان گرفت ، به توزیع احتمال نرمال برابر 1 خواهید رسید ]8[.
1-1-4- گرفتن پاسخ با سرعت بیشتر
برای شبکههای بزرگ چند بار محاسبات را تکرار کنیم ؟ این یک سوال مشکل است. برای شبکه ای به بزرگی وب جهانی ممکن است نیاز باشد چند میلیون بار محاسبات را تکرار کنیم. فاکتور تعدیل تا حدی هوشمند عمل میکند. اگر خیلی بالا باشد ، مدتها طول میکشد تا اعداد ثابت شوند و اگر خیلی پایین باشد ، تعداد تکرار بسیار زیاد میشود.
هم چنین انتخاب ترتیب محاسبات میتواند کمک کند. نتیجه در هر صورت یکسان است و ترتیبی که انتخاب میشود مهم نیست. اما بعضی ترتیبها زودتر از بقیه شما را به نتیجه میرساند. در مثالهای زیر کدهای ساده ای برای روشن کردن استفاده شده و تقریباً 20 تا 40 تکرار برای آن نیاز است ]3[.
مثالی از محاسبهی امتیاز صفحه
در این بخش الگوریتم امتیاز صفحه را روی چند ساختار متفاوت از ارتباط میان صفحات اعمال میکنیم تا بر با بررسی نتایج حاصل بتوانبم نتیجه بگیریم که آیا ساختار سلسله مراتب و پیونددهی صفحات وب روی امتیازدهی تاثیر دارد و هم چنین چه ساختارهایی باعث افزایش امتیاز صفحه و چه ساختارهایی موجب کاهش آن میشوند.
- مثال 1
برای رسیدن به این مقادیر 20 بار محاسبات را تکرار کرده ایم. به صفحهی D توجه کنید. با اینکه کسی به آن رای نداد است ، امتیاز صفحهی آن 0.15 میباشد.
بنابراین برای صفحه D که هیچ پیوند ورودی ندارد معادله به این شکل در میآید :
PR(A) = (1-d) + d * (0) = 0.15
نکته : هر صفحه حداقل امتیاز صفحهی 0.15 را دارد که آن را بین صفحاتی که به آنها پیوند میدهد ، به اشتراک میگذارد. اما این ممکن است تنها یک تئوری باشد. اما شایعاتی در مورد گوگل وجود دارد که در آن هر صفحه ای که هیچ پیوند ورودی ندارد ، هرگز کاملا از اندیس پاک نمیشود ( پیوندهای معلق ).